AI资讯新闻榜单内容搜索-大模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大模型

首次系统定义「Token经济学」，浙大&阿里联合发布大模型Agent资源分配新范式

首次系统定义「Token经济学」，浙大&阿里联合发布大模型Agent资源分配新范式

首次系统定义「Token经济学」，浙大&阿里联合发布大模型Agent资源分配新范式

当大模型 Agent 从实验室加速走向金融、医疗、代码开发等高价值场景，一个隐秘却致命的瓶颈正在浮现：Token 的指数级消耗正引发算力、协作与安全的系统性危机。传统 “堆算力、加参数” 的线性优化已触及天花板，我们该如何在 “输出质量” 与 “经济成本” 之间找到可持续的最优解？

来自主题: AI技术研报

8651 点击 2026-06-04 16:38

多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL

过去的大模型 scaling law 通常回答的是：当模型参数量、数据量和训练计算量增加后，loss 会如何下降。

来自主题: AI技术研报

7184 点击 2026-05-29 09:19

不给现金，只给超3亿美元Token！Sam Altman开始“拿算力换股份”：向169家YC公司发200万美元Token，但要拿股权来换

不给现金，只给超3亿美元Token！Sam Altman开始“拿算力换股份”：向169家YC公司发200万美元Token，但要拿股权来换

不给现金，只给超3亿美元Token！Sam Altman开始“拿算力换股份”：向169家YC公司发200万美元Token，但要拿股权来换

当年互联网创业公司最熟悉的“羊毛”，是云厂商送的服务器额度；现在，AI 创业圈的“新硬通货”，已经变成了大模型 Token。

来自主题: AI资讯

6852 点击 2026-05-26 10:27

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

智象未来正式发布基于新一代原生全模态模型架构 Unified Transformer（UiT）打造的图像大模型 HiDream-O1-Image-Pro。这一超2千亿参数的原生全模态图像大模型，不仅在多个基准测试中刷新 SOTA 纪录，也标志着智象未来正向图像、视频、文本、音频等多模态统一建模的“原生全模态”阶段迈进。

来自主题: AI资讯

9649 点击 2026-05-25 09:49

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8820 点击 2026-05-13 15:01

CVPR 2026 | 别卷推理了！当前大模型 STEM 短板在于「视觉感知」，代码才是破局关键

CVPR 2026 | 别卷推理了！当前大模型 STEM 短板在于「视觉感知」，代码才是破局关键

CVPR 2026 | 别卷推理了！当前大模型 STEM 短板在于「视觉感知」，代码才是破局关键

当多模态大语言模型（MLLMs）在面对科学、技术、工程和数学（STEM）领域的视觉推理题时频频「翻车」，一个根本性的问题摆在了所有研究者面前：大模型做不出理科题，究竟是因为「脑子笨」（推理能力受限），还是因为「眼神差」（视觉感知缺陷）？

来自主题: AI技术研报

7274 点击 2026-05-11 16:08

美团万亿级大模型LongCat-2.0-Preview 开启内测，训推全程用国产芯片

美团万亿级大模型LongCat-2.0-Preview 开启内测，训推全程用国产芯片

美团万亿级大模型LongCat-2.0-Preview 开启内测，训推全程用国产芯片

一边是 DeepSeek。2026 年 4 月 24 日，正式发布新一代模型DeepSeek-V4 系列预览版，并同步开源。另一边，美团闷声干了件大事——用全国产算力集群，训练出了万亿参数大模型 LongCat-2.0 系列预览版（ LongCat-2.0-Preview ）。

来自主题: AI资讯

10594 点击 2026-05-01 13:34

ACL 2026｜Doc-V*：读100页文档不如只翻对5页，80页场景「暴打」RAG 10个点

ACL 2026｜Doc-V*：读100页文档不如只翻对5页，80页场景「暴打」RAG 10个点

ACL 2026｜Doc-V*：读100页文档不如只翻对5页，80页场景「暴打」RAG 10个点

Doc-V* 由小米大模型 Plus 团队和华中科技大学 VLRLab 团队合作提出，一种从「静态阅读」到「主动探索」的多页文档理解新范式，通过交互式视觉推理让模型像人一样有策略地阅读长文档。

来自主题: AI技术研报

9096 点击 2026-04-30 09:00

英伟达全模态大模型 Nemotron 3 Nano Omni 来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍

英伟达全模态大模型 Nemotron 3 Nano Omni 来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍

英伟达全模态大模型 Nemotron 3 Nano Omni 来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍

英伟达于昨日正式推出全新多模态推理模型Nemotron 3 Nano Omni，将文本、视觉、语音三大模态能力深度融合至单一模型体系，目前可免费使用。

来自主题: AI资讯

9743 点击 2026-04-29 19:52

GPT-Image-2 现在最火的玩法：给人看手相，AI 把我夸飘了

GPT-Image-2 现在最火的玩法：给人看手相，AI 把我夸飘了

GPT-Image-2 现在最火的玩法：给人看手相，AI 把我夸飘了

在消耗了无数张 GPU 资源、烧掉了够几座城市用一年的电力之后，OpenAI 最新推出的 AI 生图大模型 GPT-Image-2，再次迎来了它人生中的高光时刻——给人类看手相/面相。

来自主题: AI资讯

10377 点击 2026-04-27 15:21

上一页当前第2页,共13页下一页